Amazon Comprehendでサクッと自然言語処理をやってみる #Comprehend #reInvent
こんにちは!
re:Invent2017期間限定で投稿させていただいてる
久住(くすみ)です。
今回はキーノートで発表されたAmazon Comprehendを 触ってみたいと思います。
Amazon Comprehendとは
入力言語を自動的に識別して、処理してくれます。
(関連記事: 【速報】AWSの自然言語処理サービス、Amazon Comprehendが発表されました! #reinvent)
対応言語
- 英語
- スペイン語
対応リージョン
現地時間11/29 12:00現在では下記リージョンが対応しています。
※リージョン対応表にはまだ載ってませんでした!
- us-east-1:米国東部 (バージニア北部)
- us-east-2:米国東部 (オハイオ)
- us-west-1:米国西部 (北カリフォルニア)
- us-west-2:米国西部 (オレゴン)
- eu-west-1:EU (アイルランド)
今回はus-east-1:米国東部 (バージニア北部)で試してみます。
触ってみた
Amazon comprehendにアクセス
下記ページから入ります
AWSアカウントにログインするとAmazon Comprehendに遷移
Get started をクリック
初期表示される画面
サンプルのテキスト分析結果がデフォルトで表示されています。
テキスト分析(English ver.)
実際にやってみました。
サンプルのテキストをクリア
Clear text をクリックするだけです。
分析したい英文をコピペ
今回は試しに、BBC NEWSから良さそうな英文を取ってきました。
コピペしたら、 Analyze をクリック
完成!
右側に分析結果が表示されました。
「Donald Trump」がPersonにカテゴライズされる等
正確に情報の抽出が出来ているようにみえます。
表示形式は3つから選択
「Entity(エンティティ)」の表示形式は List , Tiles, JSON の3つから選択できます。
テキスト分析(Spanish ver.)
せっかくなので、もう一つの対応言語であるスペイン語も 試してみました!
すみません、全く読めなくて結果がわかりませんでした・・・
しかし、左下に「Detected language: Spanish」と表示され
数字は「Quantity」に分類されているため、どうやら正しく抽出されているようです。
まとめ
簡単な操作で自然言語処理による情報の分類が出来ました。
日本語対応が待ち遠しいです!
今年のre:Inventで同じく発表された
翻訳サービスのAmazon Translateや文字起こしサービスの
Amazon Transcribeと組み合わせれば、ライブや映像の言葉を
リアルタイムで自然言語処理できるようになりそうですね。